Visualisierung von Beziehungen
Humboldt-Universität zu Berlin
Mi. den 25.10.2023
Letzte Woche haben wir gelernt…
dplyr aus dem tidyverse verarbeitetpipe (|>) verwendet, um das Ergebnis einer Funktion in eine andere Funktion einzuspeisenfilter(), arrange()
rename(), mutate(), select(), relocate()
dplyr-Funktionen mit Plots von ggplot2 kombiniertHeute werden wir lernen…
Die Pflichtlektüre zur Vorbereitung auf dieses Thema ist Kap. 2 (Datenvisualisierung) aus Abschnitt 2.5 in Wickham et al. (2023).
Eine ergänzende Lektüre ist Ch. 3 (Data visualtion) in Nordmann & DeBruine (2022).
tidyverse Familie von Paketen
ggplot2 für Diagrammedplyr für die Datenverarbeitungggthemes für farbenblindenfreundliche Farbpalettenpatchwork für Plot-LayoutslanguageR für linguistische DatensätzeIch habe mein bevorzugtes ggplot-Thema global festgelegt. Das bedeutet, dass nach dem Ausführen dieses Codes alle Diagramme dieses Thema verwenden werden.
Wir verwenden den english-Datensatz aus dem Baayen & Shafaei-Bajestan (2019).
exp().english datasetUnsere Variablen von Interesse sind:
| variable | description | type |
|---|---|---|
| RTlexdec | Reaktionszeiten für eine visuelle lexikalische Entscheidung (Millisekunden) | kontinuierlich |
| RTnaming | Reaktionszeiten für den Beginn einer verbalen Wortbenennungsaufgabe (Millisekunden) | kontinuierlich |
| WrittenFrequency | numerischer Vektor mit der logarithmischen Häufigkeit in der lexikalischen Datenbank von CELEX | kontinuierlich |
| Wort | ein Faktor mit 2284 Wörtern | kategorisch |
| AgeSubject | ein Faktor mit der Altersgruppe des Probanden als Level: jung versus alt | kategorisch |
| WordCategory | ein Faktor mit den Wortkategorien N (Substantiv) und V (Verb) als Ebenen | kategorisch |
| CV | Faktor, der angibt, ob das Anfangsphonem des Wortes ein Konsonant (C) oder ein Vokal (V) ist. | kategorisch |
| CorrectLexdec | numerischer Vektor mit dem Anteil der Probanden, die das Item bei der lexikalischen Entscheidung als Wort akzeptiert haben. | kontinuierlich |
Aufgabe: Beziehungen visualisieren
Aufgabe: Visualisierung von Beziehungen in Verteilungen
Abbildung 1: Visualising relationships in distributions
identity auf dodge setzen
Abbildung 2: Visualising relationships in distributions
english haben wir zum Beispiel die Variablen WrittenFreuqency und RTlexdec
fill oder colour verwenden können
geom_point() ist es auch hilfreich, shape zu verwendenAufgabe 1: Adding another variable
Beispiel 1
Wie könnten Sie eine vierte Variable in die obige Darstellung einfügen? Versuchen Sie, CV hinzuzufügen. Ergibt die Darstellung immer noch eine klare Geschichte?
facet_wrap() verwenden, das eine Formel als Argument annimmt
~ und den Namen einer kategorialen Variable, z. B. ~CV
ggplot() eingeben.
dplyr-Verb machen?Aufgabe 2: Plot-Anmerkung
Beispiel 2
#|
```{r}```
| option | values | function |
|---|---|---|
| #| echo: | true/false | should this code chunk be printed when rendering? |
| #| eval: | true/false | should this code chunk be run when rendering? |
oft wollen wir unsere Plots in einem Dokument verwenden, das nicht in RStudio erstellt wurde
um dies zu tun, müssen wir unsere Zahlen als einen akzeptierten Dateityp laden, wie jpeg oder png
Das können wir mit der Funktion ggsave() machen.
Können Sie erraten, welche Arten von Argumenten ggsave() benötigt, um unsere Diagramme zu speichern? Einige sind erforderlich, einige sind optional.
ggsave()Als Minimum benötigt ggsave() Argumente:
ggsave() optionale Argumentewidth = wie breit soll der Plot in cm, mm, Zoll oder Pixel sein?height = wie hoch soll der gespeichert Plot in cm, mm, Zoll oder Pixel sein?dpi = gewünschte Auflösung (numerisch, oder eine Reihe von Strings: “retina” = 320, “print” = 300 oder “screen” = 72)eval: falseWarnung
Setzen Sie Code-Chunks, die Dateien auf Ihrem Rechner speichern, immer auf eval: false!!! Andernfalls wird jedes Mal, wenn Sie Ihr Skript ausführen, die Datei lokal neu geschrieben.
Aufgabe 3: ggsave()
Beispiel 3
AgeSubject (x-Achse) nach CV (Facetten).RTlexdec (x-Achse) durch RTnaming (y-Achse) dar. Übertragen Sie CV auf Farbe und Form. Fügen Sie geeignete Beschriftungen hinzu.Hergestellt mit R version 4.3.0 (2023-04-21) (Already Tomorrow) und RStudioversion 2023.9.0.463 (Desert Sunflower).
R version 4.3.0 (2023-04-21)
Platform: aarch64-apple-darwin20 (64-bit)
Running under: macOS Ventura 13.2.1
Matrix products: default
BLAS: /Library/Frameworks/R.framework/Versions/4.3-arm64/Resources/lib/libRblas.0.dylib
LAPACK: /Library/Frameworks/R.framework/Versions/4.3-arm64/Resources/lib/libRlapack.dylib; LAPACK version 3.11.0
locale:
[1] en_US.UTF-8/en_US.UTF-8/en_US.UTF-8/C/en_US.UTF-8/en_US.UTF-8
time zone: Europe/Berlin
tzcode source: internal
attached base packages:
[1] stats graphics grDevices utils datasets methods base
other attached packages:
[1] kableExtra_1.3.4 knitr_1.44 languageR_1.5.0 ggthemes_4.2.4
[5] patchwork_1.1.3 lubridate_1.9.2 forcats_1.0.0 stringr_1.5.0
[9] dplyr_1.1.3 purrr_1.0.2 readr_2.1.4 tidyr_1.3.0
[13] tibble_3.2.1 ggplot2_3.4.3 tidyverse_2.0.0
loaded via a namespace (and not attached):
[1] utf8_1.2.3 generics_0.1.3 xml2_1.3.4 stringi_1.7.12
[5] hms_1.1.3 digest_0.6.33 magrittr_2.0.3 evaluate_0.21
[9] grid_4.3.0 timechange_0.2.0 fastmap_1.1.1 jsonlite_1.8.7
[13] httr_1.4.6 rvest_1.0.3 fansi_1.0.4 viridisLite_0.4.2
[17] scales_1.2.1 cli_3.6.1 rlang_1.1.1 munsell_0.5.0
[21] withr_2.5.0 yaml_2.3.7 tools_4.3.0 tzdb_0.4.0
[25] colorspace_2.1-0 webshot_0.5.4 pacman_0.5.1 vctrs_0.6.3
[29] R6_2.5.1 lifecycle_1.0.3 pkgconfig_2.0.3 pillar_1.9.0
[33] gtable_0.3.4 glue_1.6.2 systemfonts_1.0.4 highr_0.10
[37] xfun_0.39 tidyselect_1.2.0 rstudioapi_0.14 farver_2.1.1
[41] htmltools_0.5.5 labeling_0.4.3 rmarkdown_2.22 svglite_2.1.1
[45] compiler_4.3.0
Woche 2 - Datenvisualisierung 2: Beziehungen